# -*- coding: utf-8 -*-
import chardet

#python内部默认编码为unicode，这里将其编码为GB2312
a = u'俱往矣数风流人物还看今朝'.encode('gbk')
#判断字符串的编码
print chardet.detect(a)
print chardet.detect(a)['encoding']
#已知汉字编码为GB2312，将其解码为unicode
print a.decode('gbk')
#判断是否是汉字
print u'\u4e00' <= u'汉' <= u'\u9fff'